Dynamic 1.58-bit
https://unsloth.ai/blog/deepseekr1-dynamicブログ
unslothによる動的な1.58bit量子化手法、読む限りパラメータ毎の選択てきな4bit量子化やGGUFモデルの動的量子化手法のiMatrix、K_Mモデルなど既存のGGUFでの量子化アーキテクチャも総動員してDeepSeek-R1を131GBという「逸般の誤家庭ならぎりぎり動く」ラインに落とし込んでいる。
既存のBitNetの欠点であった「モデルの一からの再学習が必要」という欠点をある種解決してますね…morisoba65536.icon
https://huggingface.co/unsloth/DeepSeek-R1-GGUFunsloth/DeepSeek-R1-GGUF